¿Qué es kolmogorov smirnov test?

El test de Kolmogorov-Smirnov es una prueba estadística no paramétrica utilizada para determinar si una muestra sigue o no una distribución específica. Fue desarrollado por los matemáticos Andrey Kolmogorov y Nikolai Smirnov en la década de 1930.

El objetivo del test es comparar una muestra con una distribución teórica (que puede ser continua o discreta) y determinar si los datos de la muestra provienen de esa distribución o no. El test evalúa la diferencia entre la función de distribución acumulada (F(x)) de la muestra y la función de distribución acumulada teórica (F0(x)), y calcula un estadístico de prueba basado en esta diferencia.

El estadístico de prueba es la máxima desviación absoluta entre las dos funciones de distribución acumulada. Cuanto mayor sea el valor del estadístico de prueba, mayor será la evidencia en contra de que la muestra provenga de la distribución teórica. Este estadístico de prueba se compara con los valores críticos de la prueba de Kolmogorov-Smirnov para determinar si se rechaza o no la hipótesis nula.

La hipótesis nula del test de Kolmogorov-Smirnov establece que la muestra sigue la distribución teórica especificada. Si el valor del estadístico de prueba es mayor que el valor crítico, se rechaza la hipótesis nula y se concluye que la muestra no sigue la distribución teórica. Si el valor del estadístico de prueba es menor que el valor crítico, no se rechaza la hipótesis nula y se concluye que no hay suficiente evidencia para afirmar que la muestra no sigue la distribución teórica.

El test de Kolmogorov-Smirnov se utiliza en diferentes disciplinas, como la estadística, la ingeniería, la física y la economía, para evaluar si un conjunto de datos sigue una distribución específica, como la distribución normal, la distribución exponencial, la distribución uniforme, entre otras. También es utilizado para comparar dos muestras y determinar si siguen la misma distribución.

En resumen, el test de Kolmogorov-Smirnov es una prueba estadística no paramétrica utilizada para evaluar si una muestra sigue una distribución teórica específica. Se basa en la comparación de la función de distribución acumulada de la muestra y la función de distribución acumulada teórica, y utiliza un estadístico de prueba para determinar si se acepta o se rechaza la hipótesis nula.